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Автоматизация розробки 1 оновлення 
семантичного ядра сайта з динамичним контентом 


В результате анализа проблем продвижения в поисковых системах веб-ресурсов с динамическим 
контентом предложена методика автоматизации разработки и обновления семантического ядра 
сайта на основе создания ассоциативных правил с помощью алгоритма поиска популярных 
наборов Армон в базе поисковых транзакций. Применение методики позволило повысить полноту 
и точность, а также снизить время разработки и обновления семантического ядра сайта типа 
интернет-витрины и магазина. 
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Введение 


В век информационных технологий успех практически любого бизнеса в доста- 
точно большой степени зависит от способов виртуального представления фирмы в сети 
Интернет. При этом целью разработки контента веб-ресурса (сайта) фирмы является 
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предоставление информации, которая была бы способна заставить пользователя думать 
и вести себя в направлении, выгодном реальному бизнесу. С другой стороны, известно, 
что доля «поискового трафика» любого сайта (число посетителей, пришедших от поис- 
ковых выдач от общей посещаемости сайта) является преобладающей [1], [2]. Поэтому 
при разработке контента сайта большое внимание уделяется ЗЕО (зеагсн епеше 
орипттайоп) — комплексу мер, направленных на продвижение веб-ресурса к верхним 
позициям поисковой системы (ПС) с целью увеличения его посещаемости. Известно, 
что одним из ключевых этапов ЗЕО является разработка семантического ядра сайта 
(СЯС), которая, как правило, выполняется специалистами вручную и требует боль- 
ших временных затрат [4]. Такое положение является особенно недопустимым при 
разработке и обновлении СЯС с динамическим контентом, когда ЗЕО-специалисты 
не успевают вовремя реагировать на изменяющиеся предпочтения и действия пользо- 
вателей, внешнее интернет-окружение сайта, а также его содержимое. Поэтому акту- 
альным является создание методики разработки и обновления СЯС, применение 
которой ЗЕО-специалистами позволило сократить время на достижение и поддержание 
лидирующих позиций сайта в поисковых выдачах. Для создания методики авторам не- 
обходимо было: проанализировать связь между этапами и процедурами работы ПС и 
разработки или обновления СЯС и предложить способ ее описания; определить 
требования к формированию транзакционной базы данных в терминах анализа связей 
и разработать базу поисковых транзакций; разработать методику применения анализа 
связей к базе поисковых транзакций; предложить методику реализации поиска попу- 
лярных наборов с помощью алгоритма Арпоп и создания ассоциативных правил на 
основе найденных популярных наборов для разработки или обновления СЯС. 


Анализ этапов и процедур работы ПС 
и разработки СЯС 


ПС представляет собой сайт, состоящий из веб-интерфейса для пользователя и 
поисковой машины, которая является движком, обеспечивающим функциональность 
ПС. Поисковая машина состоит из модуля индексирования, базы данных (БД) про- 
индексированных документов и поискового сервера, занимающегося анализом и об- 
работкой запросов пользователей. Модуль индексирования состоит из трех вспо- 
могательных программ (роботов) — зр14ег (паук), ста\ег (путешествующий паук) и 
шаехег (индексатор). Паук скачивает веб-документы с помощью протокола НТТР, 
извлекает ссылки и перенаправления и сохраняет текст в следующем формате: ОВГ, 
дата скачивания, НИр-заголовок ответа сервера, тело страницы (№]-код). Стаж ег 
обрабатывает найденные пауком ссылки и осуществляет дальнейшее направление 
паука. шдехег разбирает №т]-код страницы на составные части, такие как заголов- 
ки (ие), подзаголовки (за Иез), метатэги (тейа {а5$), текст, ссылки, структурные и 
стилевые особенности и т.д, анализирует их на основе различных лексических и 
морфологических алгоритмов с целью последующего ранжирования по степени важ- 
ности. При этом найденным словам и словосочетаниям присваиваются весовые 
коэффициенты в зависимости от того, сколько раз и где они встречаются (в заголовке 
страницы, в начале или в конце страницы, в ссылке, в метатэге и т.п.). В результате 
формируется файл, содержащий индекс, который может быть довольно большим. Для 
уменьшения его размеров прибегают к минимизации объема информации и сжатию 
файла, а также решают задачи определения дубликатов и «почти дубликатов». 
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Результаты индексирования записываются в базу данных (БД) проиндексированных 
документов (рис. Та). 


Веб-ресурсы Поисковая машина ВН 
- тип веб-ресурса 


- тематика 


- структура 
Модуль индексирования "риа ИТАН 
рег (паук) Поисковая систем - наличие обратной связи 
Сга\мег | 
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запросов 
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Множество терации; 
проиндексированных « сленговые профессиональные, 
документов сокращенные и ошибочные 
* составных частей и их комби- 
наций 
- варианты действия; 
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Морфологический анализ 
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Ранжирование 
Генерация сниппета Составление списка 
Формирование ЗЕКР ассоциированных запросов 
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Г 


+ 


Пользователи <те{а пате=«Кеумогаз» ... > Контент 


а) 6) 


Рисунок 1 — Обобщенная схема этапов и процедур: 
а) — работы ПС; 6) — разработки СЯС 


Поисковый сервер является важнейшим элементом всей ПС, так как от алгорит- 
мов, которые лежат в основе его функционирования, зависит качество и скорость по- 
иска. Принцип его работы заключается в следующем. Полученный от пользователя 
запрос (ключевые слова) подвергается морфологическому анализу для получения ин- 
формационного окружения. При этом выделяются информационные (поиск сведений), 
транзакционные (совершение действия), нечеткие (общие) и навигационные (прямой 
адрес) запросы. Поиск документов по их содержанию называется семантическими. 
Информационное окружение передается специальному модулю ранжирования, задача 
которого состоит в поиске ййт/ страниц в БД проиндексированных документов, сорти- 
ровке и выдаче в порядке релевантности. При этом для оценки релевантности найденных 
документов, как правило, используют ТЕ-ГШЕ-меру, согласно которой релевантность 
документа будет выше, если слово или словосочетание из запроса чаще встречается в 
найденном документе (частота слова — {епт /"едиепсу — ТЕ) и реже других документах 
БД - ШЕ (обратная частота документа — туегуе доситеп! р'ециепсу — ФЕ). Если необхо- 
димо, прядок выдачи документов может быть изменен пользователем путем задания 
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дополнительных условий (расширенный поиск). Далее генерируется сниппет, то есть 
для каждого найденного документа из таблицы документов извлекаются заголовок, 
краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, 
причем найденные слова подсвечиваются. Полученные результаты поиска переда- 
ются пользователю в виде ЗЕВР (5еагсй Епете Кезий Рае) — страницы выдачи по- 
исковых результатов. Таким образом, основой работы всех ПС является определение 
так называемых «ключевых слов» веб-ресурса. Из списка таких слов состоит семан- 
тическое ядро сайта (СЯС). СЯС представляет собой список ключевых слов и их ком- 
бинаций, записанных в метатэги Кеу\’ог4$ и распределенных в контенте сайта, а 
именно, в тэге ПЦе, в ай-атрибутах, в ссылочном тексте внутренних и внешних 
ссылок, в выделениях жирным и наклонным шрифтом, в начале контента сайта, в 
названии файлов, в ОВГ и др. При этом от полноты и точности разработки СЯС зави- 
сит положение сайта в списке выдач ПС. 

Разработка СЯС является ключевым этапом ЗЕО и состоит из ряда интеллекту- 
альных, трудноформализуемых этапов и процедур, для реализации которых необхо- 
димы большие временные и человеческие ресурсы (рис. 1 6). 

На первом этапе необходимо оценить контент сайта, определив его тип (интер- 
нет-магазин, новостной блог, сайт-визитка и пр.), тематику, структуру, целевую ауди- 
торию и необходимость обратной связи с пользователями. Следующим этапом будет 
создание первичного списка запросов. Для этого можно использовать различные вари- 
анты названий товаров, услуг, самого сайта, различные действия, предоставляемые 
пользователям, и варианты качества товара или услуг [1]. Затем составляется список 
ассоциированных запросов с помощью средств статистики поисковых систем (\/ота- 
ва. уапаех, адза.татЫег, гоо]е/Лпз1е5/зеагсН/, аф\уогаз.го0ое и др.) и подсчитывается 
частота ключевых слов. Ключевые слова с наибольшей частотой помещают в метатэги 
Кеу\ога$, с меньшей — распределяют по контенту сайта. Однако, для сайтов с динами- 
ческим контентом, таких как интернет-витрина, магазин, новостной блог, где меняется 
ассортимент товаров, их популярность, новости, заголовки и пр., перечисленные этапы 
разработки СЯС необходимо повторять достаточно часто. При этом длительность вы- 
полнения каждого этапа может значительно задерживать необходимую периодичность 
повторения, что приводит к снижению полноты и точности СЯС, а сайт теряет свои 
позиции в ЗЕВР. Для сокращения времени разработки и обновления СЯС с динамиче- 
ским контентом без потери полноты и точности в данном исследовании предлагается 
использовать анализ связей (ШиК апа[уз1$), позволяющий сгенерировать правила коли- 
чественного описания взаимной связи между двумя и более ключевыми словами, объе- 
диненными в одном семантическом запросе. Такие правила в терминах анализа связей 
называются ассоциативными, а запрос представляет собой некоторое множество собы- 
тий, происходящих совместно, и образует транзакцию. 


Методика анализа связей 
в базе поисковых транзакций 


Транзакционная или операционная БД (ТгапзасИйоп даёаБазе) представляет 
собой двумерную таблицу, которая состоит из номера транзакции (ТПО) и перечня 
ключевых слов, составивших запрос во время этой транзакции. Пример фрагмента 
базы поисковых транзакций (БИТ) для интернет витрины Кошса-О1еНа| показан в 
табл. 1, где ТШ — уникальный идентификатор, определяющий каждую поисковую 
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транзакцию. На основе имеющейся БИТ необходимо найти связи между событиями, 
которые представляют собой поисковые запросы пользователей. 


Таблица 1 — База поисковых транзакций 


Г) | Поисковые запросы ТГ) | Поисковые запросы 

1 флешки, | онлайн 8 фото, рамки, онлайн 
7. фото, альбом 9 печать, фото 

3 фото, альбом, | онлайн 10 интернет, | магазин, | фото 

4 фото, рамки И фото, магазин, | альбом 
5 фото, рамки, | купить, | онлайн | 12 фото, магазин, | рамки 
6 печать, | фото, онлайн 13 рамки, альбом, | фото 

7 фото, магазин 14 печать, флешки 


В терминах анализа связей пусть / = {1, 1», 13, ...}- множество (набор) ключе- 
вых слов, называемых элементами. Пусть М — множество транзакций из БИТ, где 
каждая транзакция Т с уникальным номером Т/ - это набор элементов из /, ТИ. 
При этом, длиной транзакции Т с номером 7/) считается количество элементов из /, 
входящих в Т- Опр. Говорят, что транзакция Т содержит А, некоторый набор эле- 
ментов из /, если А < Т. Ассоциативным правилом (АП) состоящим из двух наборов 
элементов называется импликация АВ, где АСТ, ВТ и АПВ = © При этом А 
называют условием (агесе4еп), а В — следствием (сопзеаиеп!) и говорят «Если А то 
В». Можно выделить объективные (независимые от конкретного приложения) меры 
значимости АП. К таким мерам, описывающим связь между наборами элементов, 
которые соответствуют условию и следствию, относят поддержку — 5ирр (зиррог@) и 
достоверность сои{- (сопЯ4епсе) [3]. 

Говорят, что правило А-В имеет поддержку 5ирр, если 5ирр% транзакций из 
М, содержат АСВ (условие и следствие) 


5ирр(А>В) = 5ирр(АСЬВ) (1) 


Достоверность соп{ правила — отношение количества транзакций, содержащих 
условие А и следствие В, к количеству транзакций, содержащих только условие А — 
показывает какова вероятность того, что из А следует В. 


сопКА>вВ) = зирр(А с В)/бирр(А) (2) 


При этом говорят, правило АВ справедливо с достоверностью сои}, если соп}{% 

транзакций из М, содержащих А, также содержат В. 

Пользуясь данными из табл. | и формулами (1) и (2) рассчитаем поддержку и 
достоверность АП, когда А = «альбом», В = «фото»: 

Поддержка: зирр(альбом >фото) = 5ирр(альбом фото) = 4/14*100=28,6% 

Достоверность: соиальбом фото) = 5ирр(альбом фото) / 5ирр(альбом) = 

= 4/4*100=100% 

Таким образом, ассоциация «альбом-—фото» имеет невысокую поддержку, но ее 
достоверность равна 100%, поэтому данная ассоциация может рассматриваться как АП. 

Цель анализа связей — получить возможные АП вида 4—В для всех элементов с 
различными значениями поддержки и достоверности, которые должны быть выше 
определенных порогов, называемых соответственно минимальной поддержкой (тт- 
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5иррот) и минимальной достоверностью (ттсопйаепсе). Величины порогов зависят 
от конкретной задачи и, как правило, выбираются экспериментально. 

Методика применения анализа связей к БИТ состоит из двух этапов: 

1 Поиск всех наборов элементов, поддержка которых больше либо равна ттбир- 
ро". Такие наборы элементов называются популярными наборами (р’ециетЕ йет5ер. 

2 Разработка АП на основе популярных наборов с достоверностью большей либо 
равной ттсойХ. 

На этапе поиска популярных наборов можно выделить две процедуры: генера- 
ция наборов и расчет поддержки набора. Первые алгоритмы поиска популярных на- 
боров (АГЗ и ЗЕТМ) генерировали наборы и рассчитывали поддержку во время чте- 
ния транзакций из базы данных, не используя при этом свойство антимонотонности, 
заключающееся в том, что поддержка любого набора элементов не может превышать 
минимальной поддержки любого из его поднаборов. 

Сокращение времени поиска популярных наборов можно добиться за счет исполь- 
зования алгорима Арпоп. Работа данного алгоритма состоит из некоторого числа (про- 
ходов) повторяющихся процедур генерации А-элементных наборов-кандидатов (сап- 
аще эепегапоп) и подсчета поддержки наборов-кандидатов (сапе соипйпэ). 
При этом процедура генерация кандидатов, заключающаяся в создании К-элемент- 
ных множеств (к — номер этапа) выполняется во время чтения транзакций из базы 
данных. Далее запускается отдельная процедура вычисления поддержки каждого (- 
элементного множества, после выполнения которой происходит удаление наборов- 
кандидатов, поддержка которых меньше ттбирро. Оставшиеся К-элементные наборы 
считаются популярными ('едиепт! йетх5е!) [6]. 

Пользуясь данными БПТ (табл. 1) покажем процесс поиска популярных набо- 
ров (/_ Йет5е!) на основе алгоритма Арпо!1, который начинается с генерации 1-эле- 
ментных множеств кандидатов й, К = | + п, где и — количество всех возможных 
элементов в базе данных. Для данных из БИТ — и = 9. Результат выполнения про- 
цедуры генерации представлен в виде нормализованной таблицы (табл. 2), каждая 
строка которой содержит транзакцию с номером ТО, представляющую собой бинар- 
ный вектор Т. Элемент вектора ЦА] = 1, если й элемент присутствует в транзакции, 
иначе [А] = 0. 


Таблица 2 БИТ 1-элементных наборов в нормализованном виде 


Эл-ты щ || ь в Ц 1 16 Н в 19 

У) флешки | онлайн | фото альбом | рамки купить печать магазин | интернет 
1 1 1 0 0 0 0 0 0 0 

2 0 0 1 1 0 0 0 0 0 

3 0 1 1 1 0 0 0 0 0 

4 0 0 1 0 1 0 0 0 0 

5 0 1 1 0 1 1 0 0 0 

6 0 1 1 0 0 0 1 0 0 

7 0 0 1 0 0 0 0 1 0 

8 0 1 1 0 1 0 0 0 0 

9 0 0 1 0 0 0 1 0 0 

10 0 0 1 0 0 0 0 1 1 

И 0 0 1 1 0 0 0 1 0 

12 0 0 1 0 1 0 0 1 0 

13 0 0 1 1 1 0 0 0 0 

14 1 0 0 0 0 0 1 0 0 
Зирр. @ю) | 14,3% | 35,7% | 85,7% | 28,6% | 35,71% [7,14% 21,43% | 28,6% _| 7,14% 


«Штучний 1нтелект» 42012 469 


6бА Арсирий Е.А., Антощук С.Г., Игнатенко О.А., Трофимов Б.Ф. 


у ё 
Поддержка зирр (1,) каждого 1-элементного набора 1. вычисляется как: 


т 
зирр' (1,) = (»`&, / т) *100 › где т — количество транзакций (т = 14). При этом популярным 
УЕ 

считается набор, для которого выполняется условие 5ирр’(,) >= ттзирр. Допустим, что 
экспериментально выбранный порог поддержки составил ттзирр = 28,6%, тогда сог- 
ласно свойству антимонотонности поддержки наборов элементов, в генерации всех воз- 
можных 2-элементных наборов-кандидатов вместо исходных девяти 1-элементных мно- 
жеств будут участвовать только пять признанных популярными - {12},{18}, {14}, {5} и 
{18} (табл. 2). Результаты первого, второго и третьего прохода процедур поиска попу- 
лярных наборов согласно алгоритму Арпог! показаны в виде решетки связей начина- 
ющейся с пустого набора (рис. 2). При этом на 1 уровне располагаются 1-элементные 
наборы, на 2-м - 2-элементные и т.д. Тогда на ^-м уровне могут быть представлены 
К-элементные наборы, связанные со всеми своими (^-1)-элементными поднаборами. 
При этом если 1-элементный набор {й} согласно (1) имеет поддержку ниже заданного 
порога и, соответственно, не является популярным, тогда, согласно свойству антимо- 
нотонности, все его постнаборы также не являются популярными и отбрасываются. 
Далее 1-элементный набор {й} не участвует в генерации 2- и 3-элементных наборов. 
Таким образом, любой А-элементный набор будет популярным тогда и только тогда, 
когда все его (А-1)-элементные поднаборы будут популярными 

Таким образом, использование алгоритма Арпоп для поиска популярных наборов 
позволит резко снизить количество операций перебора всех возможных наборов эле- 
ментов из БИТ, которое с ростом числа элементов в / (| 1 |) растет экспоненциально. 


85.7% 


Рисунок 2 — Результаты работы первого, второго и третьего прохода 
процедуры поиска популярных наборов в БИТ 
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Количество повторяющихся проходов процедуры поиска популярных наборов 
согласно алгоритму Арпог! меньше или равно количеству элементов в самом длин- 
ном наборе — Г = тах (ртр), где ТШ - номер транзакции. В рассматриваемом 
примере (табл. 1) самым длинным является 4-элементный набор для транзакции с 
пятым номером, т.е Ё = 4. Однако поддержка ни одного из 3-эмементных наборов- 
кандидатов не больше иитзирр (рис. 2), поэтому процесс поиска популярных наборов 
завершается уже после 3-го прохода, и можно переходить ко второму этапу анализа 
связей в БПТ - разработки АП на основе найденных популярных наборов. 

Разработка АП для найденных популярных наборов /_Йет5е! выполняется на 
основе расчета поддержки и достоверности, используя (1) и (2) для всех импликаций 
типа А-В. При этом в качестве А используются все возможные популярные и 
непустые (^-1)-элементные поднаборы / Иет5ей., популярного К-элементного 
набора /_Иетзе. А в качестве В используется разности А между /_Йет5ех и всеми 
 Петзе.!. Например (рис.2), для набора / Петзез={1513151, поддержка котрого 
5ирр (61365)=14,3%, поднаборами будут / Иетзе={{в}, {245}, {85} }, а разностями 
В = {415}, {3}, {2} соответственно. Тогда все импликации А-В будут выглядеть, 
как А>В = {({153}—{15}),({125}—4131), ({135}—>{2})}. При этом импликация А>8В 
будет относится к АП тогда и только тогда, когда 5ирр(А>В) > ттзирр и 
сопКА—>вВ)> ттсои{. 

При условии, что для данных из БПТ (табл.1) экспериментально выбранный 
порог поддержки составил пимзирр = 28,6%., то для разработки АП будут исполь- 
зованы только 2-элементные популярные наборы / Йетзе>, т.к. поддержка 5ирр“(...) 
всех 3-эмементных наборов-кандидатов меньше тт5ирр (рис. 2). 

Сформируем все возможные импликации типа А>В для 2-элементных попу- 
лярных наборов / Йетзей> = {{113}, {134}, {1315}, {38} }. Для этого определим их 1-эле- 
ментные популярные поднаборы /_Йет5е!! и разности К. Рассчитаем их поддержку и 
достоверность, результаты запишем в табл. 3. При условии, что экспериментально 
выбранный порог достоверности составит ттсоп/ = 60%, к АП можно отнести сле- 
дующие правила: «Если фото то онлайн»; «Если фото то альбом»; «Если фото то 
рамки»; «Если фото то магазин». 


Таблица 3 — Наборы-кандидаты в АП типа импликации А—>В 


ДД петзеь ДД петзен К А>В 5ирр(А>>В) сопПДА>В) 
1218} И2лонлайн из/фото онлайн > фото (4)28,6% (4/12) 33% 
онлайн 
фото {13} фото {12}онлайн Фото —онлайн (4)28,6% (4/5) 80% 
Из 4 Из фото Ил альбом Фото > альбом (4)28,6% (4/4) 100% 
фото 
альбом 14} альбом #3} фото Альбом > фото | (4)28,6% (4/12) 33% 
й3 15 йз} фото 5) рамки фото > рамки (5)35,7% (5/5) 100% 
фото рамки 

#15} рамки #3] фото рамки фото (5)35,7% (5/12)41,6% 
Из 187 ИА фото У. магазин фото —магазин (4)28,6% (4/4) 100% 
фото 
магазин {18} магазин {13} фото Магазин > фото | (4)28,6% (4/12) 33% 
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Методика автоматизации разработки 
и обновления СЯС 


В результате анализа этапов и процедур разработки СЯС (рис. 1 6) и возможно- 
стей применения анализа связей к базе поисковых транзакций, методику автоматизации 
разработки и обновления СЯС можно представить в виде последовательности 
следующих шагов: 

1 Оценка контента сайта и исследование поисковых тенденций для определения 
первичного списка поисковых транзакций. Например, для интернет-витрины Кошса- 
Пуна! шаблон поисковой транзакции согласно территориального расположения будет 
выглядеть как «фото онлайн в Одессе», а согласно наивысшей стоимости — «фото- 
графии печать». 

2 С помощью средств статистики поисковых системы уапдех (\ога${а{.уапдех) 
формирование списка ассоциированных запросов с указанной частотой ключевых 
слов (рис. За). 

3 Формирование базы поисковых транзакций (БИТ) заданного вида на основании 
списка ассоциированных запросов (рис. 3 а) 


могдзЕаЕ,уапдех.ги Г ревень, РРЕ 
Слова Показов Слова Показов — - 
в месяц в месяц Файл Правка Формат Вид Справка 
= транзация това я 
фотоальбомы 21397 альбом +для фотографий 961 На Е флешки ы 
Е 1 онлайн 
купить фотоальбом 1649 фото альбом 2535 2 фото 
2 альбом Е 
куплю фотоальбом 1549 фотомагазины москвы 29 3 фото Е 
Е альбом 
фотоальбом скачать 1252 фотомагазин 1616 Е онлайн 
‚: 4 фото 
детские фотоальбомы 1244 фототехника 2990 4 рамки 
5 фото 
частные фотоальбомы 1071 фототовары 702 5 рамки 
р 5 купить 
частный фотоальбом 1071 фотокниги изготовление 199 5 онлайн 
6 печать 
фотоальбомы девушек 1008 фотокнига +своими руками 158 6 фото 
6 онлайн 
фотоальбомы свадебные 915 фотокнига 3874 7 фото 
7 магазин 
бесплатно фотоальбом 551 печать фотографий +в москве 3 8 фото 
8 рамки 
бесплатный фотоальбом 551 печать фотографий через интернет 155 8 онлайн 
м 9 печать 
фотоальбом +своими руками 533 печать фотографий 5171 9 фото в 
программа фотоальбом 495 выпускной альбом 1799 
а б 


Рисунок 3 — Экранные формы автоматизации разработки СЯС Котса-Пуеца1 
(а — статистики поисковых запросов в \’огаз{а.уапдех; 
б — вида БПТ в текстовом формате) 


4 Поиск популярных наборов в БИТ на основе алгоритма Арпош и формиро- 
вание базы популярных поисковых транзакций (БППТ). 

5 На основе БИПТ формирование базы возможных импликаций типа «условие 
—> следствие», расчет их поддержки и достоверности и формирование базы ассоциа- 
тивных правил. 

6 Формирование МЕТА-тэгов (Те, ОезсирИоп, Кеу\’ог4$) и, возможно, моди- 
фикация контента сайта. Например, для интернет-витрины Кошса-О1еца| мета тег 
Кеу\’огаз, будет выглядеть так: <теа пате="Кеумота5" сотеш="интернет магазин, 
магазин интернет, купить онлайн, фотографии онлайн, фотографии печать, фото- 
графии рамки, магазин рамки интернет, купить онлайн рамки, ..."”> 
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Выводы 


Реализация предлагаемой методики разработки СЯС с динамическим контентом 
позволила поднять позиции Кошса-О1еца| в ЗЕКР на 25% для 70% информационных, 
85% транзакционных и 60% нечетких запросов, вводимых пользователем в основные 
ПС Уапаех и Соозе. При этом в 1,5 раза сократились затраты рабочего времени спе- 
циалиста по ЗЕО, необходимые для достижения заявленных результатов. 

Ограниченный объем статьи не позволил показать другие приложения методики 
разработки СЯС с динамическим контентом. Однако необходимо заметить, что при 
реализации предлагаемой методики для интернет-магазина УзедеаЙ в качестве БИТ 
использовалась таблица заказов, а автоматизированное формирование атрибута сощеп 
мета тэгов Кеу\’ог4$ на основе АП также позволило повысить полноту и точность, 
снизить время разработки семантического ядра сайта. Таким образом, предложенная 
методика разработки СЯС является достаточно универсальной и с небольшими дора- 
ботками может быть применена специалистами по ЗЕО для эффективного продвиже- 
ния сайтов с динамическим контентом 
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